top of page

TEST 268 – [Fase Ω – Governance ML] GAN come controllo di coerenza: verificare che un discriminatore non distingua CMDE-aligned dai controlli oltre il caso e che le distribuzioni sintetiche siano ad alta similarità

Scopo del test
L’obiettivo di questo test è stato verificare con rigore e sotto cieco se un sistema di apprendimento avversario, composto da un generatore e da un discriminatore, potesse cogliere tracce distintive tra mappe considerate coerenti con il quadro informazionale e mappe di controllo costruite per rappresentare scenari neutri. In sostanza si è voluto comprendere se una rete neurale potesse scoprire autonomamente segnali nascosti, pattern ricorrenti o differenze statistiche non previste dal modello. Parallelamente si è indagato se le immagini sintetiche prodotte dal generatore fossero in grado di replicare fedelmente le proprietà statistiche delle mappe reali su più livelli di analisi, comprendendo non solo la somiglianza visiva ma anche la coerenza delle strutture, delle frequenze e delle caratteristiche morfologiche. Il test doveva dimostrare che il discriminatore operasse in modo indistinguibile dal caso e che i campioni sintetici risultassero statisticamente equivalenti ai reali entro soglie predeterminate, confermando così la stabilità e l’autosufficienza del quadro informazionale su cui si fonda l’intera metrica di riferimento.

Descrizione della funzione
Per questo esperimento sono stati utilizzati esclusivamente i dataset precedentemente congelati e tracciati, gli stessi impiegati nei test di coerenza precedenti. Le mappe del fondo cosmico a microonde e le distribuzioni di densità su grande scala sono state mantenute in condizioni strettamente controllate, con maschere e profili di rumore già fissati. Tutte le trasformazioni sono state applicate solo a partire dai dati di addestramento, senza mai utilizzare informazioni globali derivate dai set di validazione o di test. Le etichette che identificavano le mappe come coerenti o neutre sono rimaste sigillate fino alla fine del processo, garantendo così una separazione completa tra fase di apprendimento e fase di valutazione. Il controllo dei dati di partenza ha mostrato perfetta simmetria tra i due insiemi, con variazioni minime e non significative nelle misure di log-verosimiglianza e di energia del modello, confermando che le differenze statistiche di base non potevano costituire un indizio discriminante. Tutti gli elementi di tracciabilità — dai semi casuali agli hash dei file — hanno restituito corrispondenze coerenti, assicurando che l’esperimento fosse integralmente replicabile e privo di ambiguità.

Metodo di analisi
Il processo di addestramento è stato realizzato separatamente per i due canali principali, quello della radiazione cosmica di fondo e quello delle mappe di struttura a grande scala, adottando due varianti architetturali diverse ma complementari. In entrambi i casi il sistema è stato progettato per apprendere senza alcuna informazione di classe, cioè senza conoscere la natura delle immagini che riceveva. Durante l’addestramento si è monitorata la qualità delle mappe generate e la stabilità complessiva del modello, fermando il processo non appena i parametri di coerenza rientravano nelle soglie previste. Una volta raggiunta la stabilità, il discriminatore è stato congelato e messo alla prova in due compiti distinti: da un lato doveva distinguere immagini reali da sintetiche, e dall’altro doveva cercare, sempre in cieco, eventuali differenze tra mappe coerenti e mappe di controllo. Per la fase di verifica è stato impiegato un piccolo modulo di analisi, una testa logistica, che ha operato esclusivamente sui punteggi già prodotti dal discriminatore, in modo da testare la presenza di segnali residui. Le prestazioni sono state valutate attraverso misure statistiche standard di accuratezza e capacità discriminante, ma anche con analisi più raffinate di calibrazione e affidabilità, così da escludere effetti dovuti a casualità o a cattiva interpretazione dei dati. Parallelamente, la similarità tra mappe reali e sintetiche è stata misurata con diversi indici indipendenti: alcuni basati su rappresentazioni interne apprese in precedenza, altri fondati su grandezze fisiche osservabili come lo spettro di potenza, la morfologia topologica delle strutture e i momenti statistici di ordine superiore. Infine, si sono introdotti numerosi controlli di sicurezza, come l’inversione completa delle etichette, la riduzione della capacità della rete, la variazione dei parametri di regolarizzazione e l’uso di modelli non addestrati, per verificare che i risultati non dipendessero da artefatti numerici o da comportamenti imprevisti della rete neurale.

Risultati ottenuti
Durante la valutazione cieca il sistema ha mostrato un comportamento del tutto coerente con quello di un osservatore casuale. Nella distinzione tra mappe coerenti e di controllo, il livello di prestazione del discriminatore è rimasto esattamente in linea con le attese di un processo non informato, attestandosi intorno al cinquanta per cento di accuratezza, con variazioni minime tra un seme e l’altro e con bande di confidenza strettissime. Le misure di calibrazione hanno confermato che le probabilità prodotte dal modello erano ben distribuite e non indicavano sovra-certezza. Anche nel compito di riconoscimento tra immagini reali e sintetiche, inizialmente si è osservata una lieve asimmetria nelle prime fasi di addestramento, ma questa si è rapidamente dissolta una volta raggiunta la stabilità, dimostrando che il sistema non manteneva alcun vantaggio informativo significativo. Gli indici di similarità hanno restituito valori molto bassi, segno che le differenze tra le distribuzioni erano inferiori alle soglie fissate in preregistrazione. L’analisi degli spettri di potenza ha mostrato scostamenti statisticamente irrilevanti, la morfologia topologica delle strutture generate si è sovrapposta a quella dei dati reali lungo l’intero intervallo di soglie, e i momenti di ordine superiore hanno presentato variazioni compatibili con la fluttuazione casuale. Anche la distanza globale tra distribuzioni, valutata con un confronto kernelizzato, è risultata nulla entro l’errore statistico. Tutti i controlli indipendenti — comprese le prove con etichette rimescolate, i set nulli e i discriminatori non addestrati — hanno confermato lo stesso esito, mentre le prove di riduzione o incremento della complessità del modello non hanno mai alterato il quadro complessivo.

Interpretazione scientifica
L’esito di questo esperimento ha un valore di conferma profonda. Dimostra che, anche ponendo un sistema di apprendimento automatico nelle condizioni migliori per scovare eventuali differenze nascoste, nessuna separabilità stabile emerge tra le mappe coerenti e quelle di controllo. Tutte le misure indipendenti concordano nel mostrare che le proprietà statistiche delle mappe reali possono essere riprodotte dal generatore senza introdurre nuove informazioni, e che il discriminatore, una volta privato di qualsiasi vantaggio diretto, non è in grado di estrarre strutture significative. Ciò significa che non esiste un residuo informativo sfruttabile da un algoritmo esterno, e che le caratteristiche osservate nelle mappe cosmiche si spiegano interamente attraverso la coerenza del modello e le condizioni fisiche assegnate. La stabilità del risultato attraverso semi, architetture e parametri conferma inoltre che non si tratta di una coincidenza numerica ma di un comportamento sistemico, replicabile e intrinseco al modo in cui la metrica descrive la trasformazione dell’informazione cosmica nel tempo.

Esito tecnico finale
Il test è da considerarsi pienamente superato. Il discriminatore ha operato in perfetto regime di caso, la similarità tra dati reali e sintetici è risultata alta su ogni metrica indipendente, e tutti i controlli di sicurezza hanno restituito valori coerenti e stabili. Non sono emerse divergenze né derive temporali, la tracciabilità dei dati è completa e l’intera procedura rispetta i criteri di validazione internazionale. Il risultato conferma che il sistema di apprendimento automatico non rileva differenze sostanziali tra insiemi concettuali e che la coerenza del quadro informazionale resta integra e autosufficiente entro i limiti sperimentali più stringenti.

bottom of page